Skip to content

YOLO 模块总览 - Overview

本分类做什么

提供基于 YOLO 的深度学习推理能力,覆盖五类任务:

任务inferenceType典型输出
目标检测 Detect0轴对齐框、类别、置信度
图像分类 Classify1Top-K 类别与分数(无 bbox)
实例分割 Segment2框 + 掩码轮廓 MaskVertices
姿态估计 Pose3人体框 + Keypoints
旋转框 Obb4旋转四边形 + Angle

输入一般为 屏幕区域图像句柄(与 LoadImage 衔接)或 图片路径confidence / iou / topK 等含义见 推理输入参数说明;输出为 PascalCase JSON(见 推理结果JSON说明)。


一、与「图像识别 Match/Find」的差异

对比项YOLO(本分类)图像识别 Match/Find
依据深度学习模型,多类别模板相似度色差扫描
模板权重/加密包用户提供 小图模板
适用类别多、形变光照大固定 UI 图标、模板稳定

选型:UI 固定且可截模板 → Match 往往更轻;多类物体、形变大YOLO


二、典型流水线

  1. YoloLoadModelExYoloLoadModel 得到 modelHandle
  2. 可选 YoloSetModelConfigYoloSetModelConfigByKeyYoloGetModelInfo
  3. GetScreenDataPtr / LoadImage 或直接屏幕/文件推理。
  4. 调用对应 YoloDetect* / YoloClassify* / …,解析 JSON 后 FreeStringPtr
  5. YoloReleaseModel 释放句柄。

三、模型类型与设备

modelType:0 TensorRT Engine,1 ONNX,2 NCNN(.bin + .param)。

inferenceType:0 Detect,1 Classify,2 Segment,3 Pose,4 Obb;加载时须与权重任务一致。

inferenceDevice-1 CPU;0+ GPU 索引;不可用时可能回退 CPU(见 ModelInfo 的 ProviderFallbackReason)。


四、加密包

可使用 YoloEncryptModel 打包分发,运行时 YoloLoadModel 加载。


五、侧栏文档结构

未在 ola_yolos.def 导出的头文件接口(如 YoloInferYoloWarmup)暂无对外文档页。